83 research outputs found

    FemSMA Corpus Workbench. Ein Werkzeug zur Unterstützung der qualitativen und quantitativen Analyse von textuellen Daten

    Get PDF
    In various areas of (linguistic) research, there is a need to analyse larger amounts of textual data. Digitisation and the availability of computational linguistics tools offer substantial support in qualitatively and quantitatively analysing those data sets. Keeping, maintaining and presenting data and their metadata within one system facilitate data inspection and browsing. Quick assessment of data sets for the presence or absence of specific textual characteristics is supported by the possibility to manually annotate segments of text with theory-driven meta-information in combination with automatic analysis employing computational linguistics tools and computerized search. In the present contribution, the FemSMA Corpus Workbench CWB is introduced. CWB is a computational linguistics tool for manual and automatic annotation and analysis of text documents. CWB supports storage and maintenance of, and annotation and search in textual data and related metadata. CWB is a client-server application with a web interface as frontend for data inspection and manual annotation. Data storage and automatic processing is done at server side. Automatically annotated are word-level features such as parts of speech; general word features such as capitalisation, character reduplication, abbreviation; swear words and emotion words. Due to its modular system architecture, CWB can be flexibly extended, which, however, requires the involvement of computational linguists to adapt and extend CWB’s automatic analysis and search functionalities, and represent the new functionality in the web interface

    DiTo-Datenbank : Datendokumentation zu Funktionsverbgefügen und Relativsätzen

    Get PDF
    In dieser Arbeit werden die DiTo-Daten zu Funktionsverbgefügen und Relativsätzen beschrieben. DiTo ist ein am DFKI entwickeltes Testwerkzeug für die Fehlerdiagnose der Syntaxkomponente natürlichsprachlicher Systeme. Mit diesem Tool, das zum Ziel hat, möglichst alle wesentlichen Phänomene deutscher Syntax anhand von Testdaten zu repräsentieren, kann die Fehlerdiagnose bei Testläufen natürlichsprachlicher Systeme systematisch unterstützt werden. Bisher beinhaltet der Datenkatalog die Bereiche Verbrektion, Satzkoordination, Funktionsverbgefüge und Relativsätze. Wir arbeiten mit anderen Gruppen zusammen, die weitere Syntaxthemen entsprechend den Richtlinien unseres Ansatzes erarbeiten. Damit ausgewählte Syntaxgebiete separat getestet werden können, sind die Daten in einer relationalen Datenbank organisiert. In den Teildokumentationen zu den beiden hier behandelten Syntaxgebieten werden die Phänomene zuerst skizzenhaft beschrieben. Dann wird die der Datensammlung zugrundeliegende Systematik erläutert. Anschließend wird gezeigt, wie die Daten in der relationalen Datenbank organisiert sind

    RRL: A Rich Representation Language for the Description of Agent Behaviour in NECA

    Get PDF
    In this paper, we describe the Rich Representation Language (RRL) which is used in the NECA system. The NECA system generates interactions between two or more animated characters. The RRL is a formal framework for representing the information that is exchanged at the interfaces between the various NECA system modules

    Socialite in derSpittelberg: Incorporating Animated Conversation into a Web-Based Community-Building Tool

    Full text link
    2 sysis interactive simulations a

    DiTo-Datenbank : Datendokumentation zu Funktionsverbgefügen und Relativsätzen

    Get PDF
    In dieser Arbeit werden die DiTo-Daten zu Funktionsverbgefügen und Relativsätzen beschrieben. DiTo ist ein am DFKI entwickeltes Testwerkzeug für die Fehlerdiagnose der Syntaxkomponente natürlichsprachlicher Systeme. Mit diesem Tool, das zum Ziel hat, möglichst alle wesentlichen Phänomene deutscher Syntax anhand von Testdaten zu repräsentieren, kann die Fehlerdiagnose bei Testläufen natürlichsprachlicher Systeme systematisch unterstützt werden. Bisher beinhaltet der Datenkatalog die Bereiche Verbrektion, Satzkoordination, Funktionsverbgefüge und Relativsätze. Wir arbeiten mit anderen Gruppen zusammen, die weitere Syntaxthemen entsprechend den Richtlinien unseres Ansatzes erarbeiten. Damit ausgewählte Syntaxgebiete separat getestet werden können, sind die Daten in einer relationalen Datenbank organisiert. In den Teildokumentationen zu den beiden hier behandelten Syntaxgebieten werden die Phänomene zuerst skizzenhaft beschrieben. Dann wird die der Datensammlung zugrundeliegende Systematik erläutert. Anschließend wird gezeigt, wie die Daten in der relationalen Datenbank organisiert sind

    Fully generated scripted dialogue for embodied agents

    Get PDF
    This paper presents the NECA approach to the generation of dialogues between Embodied Conversational Agents (ECAs). This approach consist of the automated construction of an abstract script for an entire dialogue (cast in terms of dialogue acts), which is incrementally enhanced by a series of modules and finally ''performed'' by means of text, speech and body language, by a cast of ECAs. The approach makes it possible to automatically produce a large variety of highly expressive dialogues, some of whose essential properties are under the control of a user. The paper discusses the advantages and disadvantages of NECA's approach to Fully Generated Scripted Dialogue (FGSD), and explains the main techniques used in the two demonstrators that were built. The paper can be read as a survey of issues and techniques in the construction of ECAs, focusing on the generation of behaviour (i.e., focusing on information presentation) rather than on interpretation

    OpenBMLParser: An Open Source BML Parser/Analyzer

    Get PDF
    van Welbergen H. OpenBMLParser: An Open Source BML Parser/Analyzer. In: Aylett R, Krenn B, Pelachaud C, Shimodaira H, eds. Intelligent Virtual Agents. Lecture Notes in Computer Science. Vol 8108. Springer; 2013: 432-433
    corecore